Aula 


CORRELAÇÃO LINEAR, TIPOS 
DE CORRELAÇÃO. REGRESSÃO 
LINEAR PELO ESTUDO DA 
CORRELAÇÃO E UTILIZANDO 
OS MÍNIMOS QUADRADOS 


Avaliar o grau de relacionamento entre variáveis e a tendência das mesmas 
com base em observações de uma série de dados. 


OBJETIVOS 

Ao final desta aula, o estudante deverá: 

Saber calcular e interpretar o grau de correlação entre variáveis? 

Saber calcular e interpretar a tendência de comportamento entre variáveis? 


PRÉ-REQUISITO: 

Conhecimentos sobre estatística descritiva e estatística indutiva, temas vistos 
em aulas anteriores, além de Papel, Calculadora ou Computador para 
realização dos cálculos. 
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INTRODUÇÃO 


Olá! Tudo bem? Vamos dar sequência ao nosso estudo da estatística 
com a introdução de temas relacionados com Correlação e Regressão linear. 

Nesta aula você vai tomar conhecimento que a regressão e a cotrela- 
ção linear são técnicas destinadas a estudar o relacionamento entre duas 
variáveis. Estas relações além de serem importantes são fáceis de serem 
interpretadas e podem ser aplicada em muitos estudos da vida real e 
consequentemente em estudos biológicos. 

A análise de correlação tem por objetivo medir a intensidade de rela- 
ção entre as variáveis, devemos estar atentos aos princípios desta relação. 
Nas correlações supostamente lógicas, as relações causais se compreen- 
dem claramente. Nas chamadas correlações ilusórias não se encontra ne- 
nhuma conexão razoável entre as variáveis. Assim o tamanho de uma po- 
pulação de insetos pode estar correlacionado com a altura de certas ervas 
ou, pode ser simplesmente uma função do tempo. Pode não haver relação 
ecológica entre as plantas e os insetos, mas sim com uma outra variável. 

Também vamos estudar os tipos de correlação e como calcular o co- 
eficiente de correlação. 

Na regressão você vai aprender a estimar a relação de uma variável 
com outra, expressando a variável dependente em função da variável in- 
dependente. A regressão estuda conjuntos de variáveis que se supõe estar 
numa relação de causa e efeito. O estudo da regressão vai te conduzir a 
um acompanhamento da tendência da variável dependente em função do 
comportamento da variável independente. 
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REGRESSÃO E CORRELAÇÃO 


Quando se deseja estudar o comportamento simultâneo de duas ou 
mais variáveis, emprega-se a análise de Regressão e a de Correlação para 
avaliação da informação desejada. 

Na regressão estimamos a relação de uma variável com outra, expres- 
sando a variável dependente em função da variável independente. A re- 
gressão estuda conjuntos de variáveis que se supõe estar numa relação de 
causa e efeito. 

A correlação que às vezes se confunde com regressão, estuda o grau 
em que duas ou mais variáveis variam simultaneamente. Isto é, o grau de 
inter-relacionamento entre as variáveis. 

- Os métodos de regressão e correlação não podem ser aplicados em 
variáveis qualitativas (atributos). É preciso que as variáveis sejam contí- 
nuas. De acordo com a função de regressão podemos ter: Correlação Retilínea, 
Exponencial, Parabólica, Potencial, etc. 


CORRELAÇÃO 


É o estudo do grau de associação entre variáveis. Na correlação inte- 
ressa observar se duas ou mais variáveis são independentes ou variam 
juntas. 

- Tamanho do braço ou tamanho da perna em uma população de mamíferos. 
- Conteúdo de colesterol no sangue e peso de pessoas de mesma idade e sexo. 
- Estatura dos pais e estatura dos filhos de pessoas de mesma raça. 

- Renda e consumo pot faixa de salário. 

- Preço e Demanda. 


- Produção agrícola e fertilizante. etc, 


Como o objetivo da análise de correlação é medir a intensidade de 
relação entre as variáveis, devemos estar atentos aos princípios desta re- 
lação. Nas correlações supostamente lógicas, as relações causais se com- 
preendem claramente. Nas chamadas correlações ilusórias não se encon- 
tra nenhuma conexão razoável entre as variáveis. Assim o tamanho de 
uma população de insetos pode estar correlacionado com a altura de al- 
gum tipo de erva ou, pode ser simplesmente uma função do tempo. Pode 
não haver relação ecológica entre as plantas e os insetos. À população de 
insetos pode depender de outras variáveis que não necessariamente a al- 
tura das ervas. 
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Tipos de Correlação: 


Correlação Simples — quando se estuda o grau de relação entre duas 
variáveis, sendo uma dependente (Y) e outra independente (X). 


Correlação Múltipla — quando se estuda o grau de relação simultânea 
entre a variável dependente e duas ou mais variáveis independentes. 


Correlação Parcial — no caso de uma relação múltipla, quando se estuda 
a relação pura entre duas variáveis, depois de eliminada estatisticamente 
a influencia de outras variáveis independentes. 


CORRELAÇÃO LINEAR 


Investiga a existência de associação entre duas variáveis, isto é, o grau de 
inter-relacionamento entre a variável dependente e a independente. Porém 
devemos ficar atentos que a correlação linear simplesmente comprova uma 
variação concomitante entre duas variáveis, não significando, a priori, que 
uma é causa da outra, visto que muitas outras variáveis, não consideradas 
no estudo, podem afetar o comportamento da variável dependente. 

De acordo com a relação entre as variáveis esta correlação pode ser: 


Direta ou Positiva — quando a variável dependente está diretamente re- 
lacionada com a variável independente. Ex.: Renda e Consumo. 


Indireta ou Negativa — quando a variável dependente tem relação in- 
versamente proporcionalmente com a variável independente. Ex.: Preço 
e Demanda. 


Nula — quando não há inter-relação entre as variáveis. 
+ 4 4 


> > > 
Correlação Positiva Correlação Negativa Correlação Nula 
r>0 r<0 r=0 
O diagrama de dispersão indica a forma da relação entre as variáveis 
estudadas e proporciona uma idéia sobre as funções de regressão a serem 
utilizadas. A depender da relação entre as variáveis, os pontos observa- 
dos, às vezes, se encontram, relativamente, próximos da linha de regres- 
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são e em outras situações bastante disseminados em torno dela. Para 
melhor quantificar esta “aproximação” é necessário determinar um coefi- 
ciente de correlação entre as variáveis. Porém não devemos interpretar a 
palavra “correlação” como a que quantifica uma relação de causa (ex: 
emissão do Banco Central) e efeito (ex: índice de preços ao consumidor). 
O valor obtido assinala unicamente uma relação funcional em determi- 
nado conjunto de dados. 


MEDIDAS DE CORRELAÇÃO 


Coeficiente de Correlação (r) é a medida estatística que dimensiona o 
grau de relação entre duas ou mais variáveis. 


Sendo: x, desvios reduzidos da variável independente(x =X —X) 
r= LX, — 
RE y, — desvios reduzidos da variável dependente (y = Y, -Y). 
(n—-D*ss ú Ê : i 
e n número de valores observados. 


s es — desvio padrão das respectivas variáveis. 
4 y = 


O coeficiente de correlação, também, pode ser calculado através do 
estudo das variâncias. A variância total (O ? é a soma da variância explicada 
(6. mais a variância residual (0 9, isto é: 0? =0/+ 0/7. 

Dividindo ambos os membros da equação pela variância total te- 
mos:1=02/0*+ 07/07. A razão O */O corresponde ao coeficiente de 
alienação (k?) e mede o grau de afastamento entre as variáveis, enquan- 
to que 0,2/0* mede o grau de aproximação existente entre as variáveis, 
sendo conhecido por coeficiente de determinação (t?). 

Neste caso podemos encontrar o coeficiente de correlação a partir do 
coeficiente de determinação, isto é: 


1=2+4K >e-1- 5+1=V4-E 


Existindo uma perfeita relação entre as variáveis o coeficiente de 
determinação (1? é igual a um (1), enquanto o de alienação é zero. O 
coeficiente de correlação pode, no máximo, ser igual a + 1. Isto é: 

1 = os fa 1 —0 => r=+1, compreendendo valores no 
intervalo: —1<Sr<1. 


Para: r=1 ou r=—1 => perfeita correlação positiva ou negativa. 
Para: r=0,50u r=—0,5 = regular correlação positiva ou negativa. 


A medida que o valor de r se aproxima de 1 ou de —1 a correlação 
entre as variáveis vai se tornando forte. Quando r tende para “zero” a 
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correlação passa a ser fraca. Quando r = O não existe a correlação procu- 
rada (correlação nula), podendo, no entanto, existir outro tipo de correla- 
ção, razão pela qual devemos ser bastante cautelosos quando afirmarmos 
da inexistência de correlação entre variáveis. 


Equação de Regressão da variável dependente (função linear). 


PS = TS 
--D— 3 Y-Y-= 
Vi: o DOG. 


Xx1 


(X,— X) 


Exemplo: calcular o coeficiente de correlação entre altura (X) e peso (Y) 
de uma amostra de 10 estudantes universitários. Estimar o peso de um 


estudante com 196 cm de altura. 


156 76 


170,40 694,0 


x? 184 
s2=> = —=020,440 > ís=452 
x n-1 9 ii 
Ly? 170,40 
2 E, = ——  — = 
= 3 = 189333 =» s,=435 


Coeficientes de Correlação 


LX, 156 


r= Ds, 9X452X435 = 0,79 => Otima correlação positiva. 
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Equação de Regressão 


e = 0,88* 4,3 
xD > vy-64-SE40 y 47) 
i Ss i i i 

x 4,52 


Y,=-69,4+0,88X, 

Peso esperado para um estudante com 196 cm de altura. 
Y,=-69,4+0,88(196) =>  Y=90kg 

Avaliação da Estimativa 

Variância Total: s?=18,9333 Variância Residual: s?=4,4733 
Variância Explicada: sr= 14,4600 

Coeficiente de Variação Residual: Cr = 3,05% 


Coeficiente de Determinação: 12=0,7744 =77,44 


REGRESSÃO 


É o estudo do comportamento de uma variável dependente (Y ) em fun- 
ção da variação de uma ou mais variáveis independentes (X., Z, W,, ...) 
supondo que estas variáveis estão numa relação de causa e efeito. 
Regressão Linear: A relação funcional entre as variáveis implica na possi- 
bilidade de estimar o valor de uma variável, dado o valor da outra, de acordo 
a função matemática que apresente melhor aderência aos dados observados. 

Convém, porém observar que em algumas situações, a relação entre 
as vatiáveis podem não estar sujeita a uma relação de causa e efeito. Por 
uma simples relação acidental ambas podem ser função de uma causa 
comum que as afeta. Isto, porém, não tira a importância que tem a regres- 
são no estudo do relacionamento entre variáveis. É preciso apenas cuida- 
do e nos casos mais difíceis de identificação da relação, pode-se optar por 
uma regressão múltipla, para maior segurança de análise e das projeções a 
serem efetuadas. 

Na regressão a variável independente (X) se mede sem erro. Ela não 
varia ao acaso, está sempre ao controle do investigador. Somente a vatiá- 
vel dependente (Y) é que é aleatória, e esta sujeita a pequenas variações 
(afastamentos) a depender do grau de relação entre as variáveis e do modelo 
de regressão utilizado. 
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Assim a dosagem de certo tipo de droga (X) aplicada em pacientes, 
está sobre o controle do pesquisador, porém a pressão sanguínea (Y) é 
aleatória, dependendo, portanto, da relação causa-efeito entre as variáveis. 

A determinação de uma equação de ajuste depende do comporta- 
mento dos dados, inicialmente observados pelo diagrama de dispersão 
entre as variáveis, com conclusão assegurada pelo “critério dos mínimos qua- 
drados” que indica como melhor função ajustante aquela que minimiza a 
soma dos quadrados das diferenças entre os valores observados (Y) e os 
estimados (Y) pelas respectivas funções: À (Y,— Y)? = mínimo. Isto é, 
quanto menor a variância residual, melhor a equação ajustante. 

Na regressão ente duas variáveis as principais relações a serem estu- 
dadas são: 

Y=a+tbX ;Y>abl; Y>a+bX+cX;Y>aX?.. 

Uma vez especificada a forma de relação entre as variáveis, deve-se 
estimar os coeficientes da função, obtendo assim a equação de Regres- 
são. Para isto é preciso ter informações acumuladas (mínimo de 10 itens) 
das variáveis estudadas para se descobrir a tendência de seu comporta- 
mento (regularidade); e, dessa forma, escolher qual dos modelos existen- 
tes de regressão é o mais apropriado. 

Algumas funções ajustantes podem ser identificadas pelas diferenças 
entre os valores observados da variável dependente. Se as primeiras dife- 
renças: (Y,-Y);(Y,-Y)..sY/ —Y |) forem mais ou menos constan- 
tes, dizemos que a variável se ajusta a uma reta. No caso das segundas 
diferenças se apresentarem mais ou menos constantes, a variável se ajus- 
ta a uma parábola do segundo grau. 

O diagrama de dispersão também nos fornece boa orientação do tipo 
de função que melhor se ajusta aos dados. Porém, a decisão final, quanto 
à melhor função ajustante depende do coeficiente de variação resi- 
dual e/ou do coeficiente de determinação, visto que a medida de 
aderência é representada pela minimização dos resíduos entre os valores 
observados e os estimados pela função de regressão. 

Conhecida a equação ajustante e reconhecida a sua máxima aderên- 
cia, isto é: menor variância residual podemos fazer previsões do compor- 
tamento da variável dependente para os próximos períodos da série estu- 
dada. Mesmo assim é preciso muita cautela, tendo em vista a 
multiplicidade de fatores que podem influir nos resultados obtidos pela 
regressão. Por exemplo: a produção agrícola não depende apenas da 
pluviometria, outros fatores como: qualidade das sementes, esgotamento 
do solo, fertilizantes, etc., podem influir decisivamente no volume de 
produção, fatos que na realidade desprezamos quando aplicamos a re- 
gressão linear. 
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Tais advertências, no entanto, não invalidam as relações de depen- 
dência entre duas variáveis, mas simplesmente chamam nossa atenção 
para os cuidados que devemos ter com as estimativas. 

Consideremos a representação gráfica do diagrama de dispersão. 


Y;4 


d 


d 


d=L(Y,Y) 


Como os desvios d podem ser positivos ou negativos caso estejam os 
pontos observados, respectivamente, acima ou abaixo da função ajustante 
consideram-se então os quadrados de d para cálculo do afastamento mé- 
dio, neste caso representado pelo desvio padrão residual. 

Note-se que a função ajustante quase nunca contém os dados obser- 
vados, mas deve representar com grande aproximação, o conjunto desses 
pontos, isto é, deve representar o comportamento da série observada. 
Para termos uma boa regressão é importante levarmos em conta as se- 
guintes considerações: 

1. Quanto maior o número de observações, tanto melhor será a estimati- 
va obtida. 

2. Os métodos de ajustamento são válidos para dados isentos de 
tendenciosidade. 

3. Escolher sempre a melhor função ajustante de acordo com os critérios 
já estabelecidos, pelo método dos mínimos quadrados, onde: À (Y, — oi E 
mínimo. 


REGRESSÃO DA LINHA RETA > v=a+Bx 


1 


É indicada quando a representação dos pontos observados em um 
diagrama de dispersão apresenta uma sequência retilínea. 

Para determinar os coeficientes “a” e “b” recorre-se ao método dos 
mínimos quadrados >, (Y, — da = mínimo. Sendo: Y, = valor observado; 
Y, = valor estimado pela equação de regressão. 
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Substituindo Yi (por a + bXi) na equação X (Y, - Y)? = mínimo e 
derivando parcialmente a equação em relação aos coeficientes “a” e “Hb” 
encontramos um sistema de equações, que nos permite estimar os coefi- 
cientes da equação de regressão. 


k=2(Y-a-bX)? = mínimo 


dk=-25 (Y-a-b X) e K&=-22X(Y-a-bX) 
da ob 


Para que Z seja mínimo as derivadas parciais devem ser iguais a zero. 
—-25 (Y,-a-bX)=0 > LY,=na+bLX 


-22X,(Y,-a-bX)=0 = 2XY, = abX + bAX? 


Z 


Equação Ajustante: > +, Sa + DA. 


Exemplo: consideremos os dados relativos a quantidade de fertili- 
zante utilizada (X)ea produção obtida (Y) de soja em determinado 
município, conforme tabela a seguir: 


Para termos uma idéia inicial do modelo de regressão a ser utilizado, 
elaboramos o diagrama de dispersão das variáveis. Pela tendência apre- 
sentada vamos trabalhar uma função linear, cujos coeficientes podem ser 
obtidos pelas equações normais ou pelos desvios reduzidos das respecti- 
vas variáveis. 


O 100 200 300 400 500 600 700 X 
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4.000 10.000 


E 
20 


Fertilizante (X)| Produção (Y) 


2 
i 


187.000 |1.400.000 


Coeficientes da Reta 


LY,= na + bJX, = 420 = 7a + 2.800b 

Ex NeaLR APEX? = 187.000 = 2.800a + 1.400.000b 
a = 32,86 e b= 0,068 

Equação Ajustante: Z=a+rbX = Y=32,86+0,068X 


A função linear X = 32,86 + 0,068X. fornece a relação entre a 
produção obtida (Y) e a quantidade de fertilizante empregada (X). Este 
modelo pode ser utilizado para estimar a variável dependente de acordo 
com o comportamento da variável independente. Isto é, admitindo a uti- 
lização de 800 kg de fertilizante por ha a produção esperada de soja é de 
87 toneladas. 

Para melhor avaliar se a equação ajustante encontrada é a opção mais 
adequada, devemos calcular a o erro de estimativa por intermédio do 
desvio padrão residual e comparar com a de outros modelos de regressão. 
A função que apresentar menor erro de estimativa, isto é: menor Coefici- 
ente de Variação Residual é a melhor opção. 

Variância residual: é calculada entre os valores observados e estima- 
dos da variável dependente, para um mesmo período. A raiz quadrada 
deste valor representa o Erro Padrão de estimativa ou Desvio Padrão 
Residual. 


s2= (Y, — 3» /(n— 1) Variância Residual Relativa: s? = s? / Z 
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Coeficiente de Variação Residual Cr =s / Y 


Variância Explicada — é calculada entre os valores estimados da vari- 
ável dependente e a média dos valores observados: 


PELO Nil) 


Variancia Total — é calculada entre os valores observados da variável 
dependente e sua respectiva média. A variância total é igual à variância 
explicada mais a variância residual. 


s2=H(Y,-Y)2/(n-1) 


Estas duas últimas variâncias fornecem condições para calculo do 
coeficiente de determinação (1º) que pode comprovar a existência ou não 
de boa correlação e regressão entre as variáveis observadas. O coeficien- 
te de determinação indica quantos por cento a variação explicada pela 
regressão representa da variação total. Isto é, este coeficiente indica o 
grau de explicação do modelo proposto, onde: O < 1 <1. 

No caso em que rt? = 1, todos os pontos observados se situam “exata- 
mente” sobre a reta de regressão. Diremos então que o ajuste é perfeito, 
isto é, as variações de Y, são 100% explicadas pelas variações de X, não 
havendo, portanto desvios em torno da função estimada. 

Por outro lado, se 1? = (), concluiremos que as variações de Y, são 
exclustvamente aleatórias, isto é: a variável X não tem nenhuma partici- 
pação sobre as variações de Y 

Exemplo: Ajustar a Função Linear ao consumo residencial de ener- 
gia elétrica no Estado de Sergipe (1987 — 96) e projetar este consumo 
pata 1997. 1098 e 1999. 


234 
265 
289 


RSS RR O DS 
E 
Ds [E [E (um [a 


Total J262 45 1 16.792 285 
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Coeficientes da Reta 


LY,= na +b)X 2XY,=aLX + bLX? 

3282 = 10a+ 45b 16.792 = 45a + 285b 

a = 217,86 e b=24,52 

Equação Ajustante: Y=a+bX => Y=217,86+24,52X 


Estimativa do consumo residual de energia elétrica. 
Yo, = 463 (1000 Mwh); Yos = 488 (1000 Mwh) e Yo = 512 (1000Mwh). 


Uma característica a ser observada nas estimativas é que a soma dos valores 
ajustados sempre é igual a soma dos valores observados: XY = XY. 


Avaliação das Estimativas 
- Variância Residual: s?= D(Y,— EO (n— 1) = 5652/9 = 628,00 
- Desvio Padrão Residual: = st = 25,0599 


- Coeficiente de Variação Residual (erro de estimativa): Cr=s / Y 
Cr= 25,0599/9 = 7,64% 


- Vatiância Total: s2= D(Y,-Y)/ (n— 1) = 55215,60/0 =>s?= 6135,07 
- Variância Explicada: s ? = 5.507,07 


- Coeficiente de Determinação: 1r?= s*/s?. => — += 0,8976 = 89,76% 


ATIVIDADES 


1. Foram obtidos no Departamento de Nutrição, em certa Empresa, os 
seguintes dados sobre conversão alimentar em bovinos: Verificar se há [ 
correlação entre as variáveis, calculando o coeficiente de correlação e 
estimar a Conversão Alimentar para bovinos com idade de 8 anos. 
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2. Considerando-se uma amostra de 10 plantas de milho, com medição de 
peso e altura de cada planta, verificar a correlação entre os dados e a 
estimativa de peso para uma planta com 30 cm de altura. 


3. Em determinada empresa industrial a relação entre horas trabalhadas e 
a produção obtida em toneladas, foi a seguinte: Calcular o coeficiente de 
correlação e a equação de regressão. Estimar a produção para 15 horas 
trabalhadas. 


4. À tabela abaixo relata os custos de manutenção por hora, classificados 
por idade de máquina em messes. Determine a equação dos custos sobre 
a idade e faça uma previsão de custo para uma máquina de 45 meses. 


5 


5. Calcular a função linear dos dados abaixo e estimar a frequência desta 
variável para 1999, relativo ao número de casos confirmados de AIDS, 
no Brasil, por exposição sanguínea, em pessoas do sexo feminino. 


1990 1991 1992 1993 1994 1995 


Número | 115 103 85 74 65 


6. As idades e pesos (médios) de um grupo de crianças estão registrados 
no quadro que se segue: 

a) Calcular o coeficiente de correlação linear e a reta de regressão da vati- 
ável dependente. 

b) Estime o peso médio de uma criança para a 12º semana da vida 


Smam xi1 [2] 3 ]4[5 [6 ]7 [8 Jo [10 
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7. À tabela abaixo apresenta uma amostra com os pesos de 10 pais e de 
seus filhos mais velhos. Calcular o coeficiente de correlação entre os pe- 
sos dos pais e dos filhos e estime o peso de um filho para um pai com peso 
de 75 kg. 


Peso dos filhos |63 65: | 68 | 70 [75 


CONCLUSÃO 


Nesta aula você aprendeu o que é correlação linear e como identificar 
neste estudo a variável dependente e a independente. Vai conhecer os tipos 
de correlação linear, bem como o significado do coeficiente de correlação. 
Passa a entender que a análise de correlação tem por objetivo medir a in- 
tensidade de relação entre as variáveis e nas correlações supostamente lógi- 
cas, as relações causais se compreendem claramente. É o que acontece 
quando você quiser mensurar a relação entre variáveis como: Renda e Con- 
sumo, Preço e Demanda, Estatura dos pais e Estatura dos filhos etc. 

Com o estudo da regressão aprendeu a estimar o comportamento de 
uma variável em função de uma outra considerada independente. A regres- 
são estuda conjuntos de variáveis que se supõe estar numa relação de causa 
e efeito. O estudo da regressão vai te conduzir a um acompanhamento da 
tendência futura de determinada variável, isto é: o que você pode esperar 
que aconteça amanhã com uma determinada variável em função do com- 
portamento que a mesma teve no passado. 

É fundamental para se trabalhar com segurança na aplicação da 
Correlação e da Regressão que tenhamos a disposição uma série históri- 
ca com no mínimo dez informações, para que se tenha um estudo con- 
sistente de associação entre as variáveis e consequentemente de ten- 
dência, permitindo deste modo trabalhar com uma margem de erro bem 
pequena nas estimativas. 

No final da aula temos uma lista de exercícios para serem resolvidos 
em grupos de no máximo cinco pessoas ou individual. Com certeza você 
vai ficar muito satisfeito com os resultados do seu desempenho. 
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RESUMO 


Correlação é o estudo do grau de associação entre variáveis. Na cot- 
relação interessa observar se duas ou mais variáveis são independentes 
ou vartam juntas. 

Como o objetivo de análise de correlação é medir a intensidade de 
relação entre as variáveis, você deve estar atento aos princípios desta 
relação. Nas correlações supostamente lógicas, as relações causais se com- 
preendem claramente. Nas chamadas correlações ilusórias não se encon- 
tra nenhuma conexão razoável entre as variáveis. 

De acordo com a relação entre as variáveis a correlação linear pode ser: 
direta ou positiva, indireta ou negativa e nula. 

O diagrama de dispersão indica a forma da relação entre as variáveis 
estudadas e proporciona uma boa visão sobre as funções de regressão a 
serem utilizadas. Mas para melhor qualificar esta aproximação é necessá- 
rio determinar o coeficiente de correlação entre as variáveis, cujo valor 
sempre está em um intervalo entre menos um a mais um, e escolher a 
equação de regressão mais adequada. 

A função de regressão pode ser obtida a partir do estudo da correla- 
ção, bem como a partir da aplicação dos mínimos quadrados entre os 
valores observados e os esperados da variável dependente. Dispondo da 
equação de regressão você deve calcular a variância residual e 
consequentemente o erro de estimativa para cada regressão. Uma boa 
regressão sempre trabalha com uma margem de erro menor do que 10% e 
quanto mais próximo de “zero” estiver este erro melhor é a equação de 
regressão. 


AUTO-AVALIAÇÃO 


Sou capaz de fazer estudos sobre correlação linear? 

Sou capaz de fazer estudos sobre regressão linear? 

Sou capaz de construir diagramas de dispersão e calcular erro de esti- 
mativas? 


Correlação linear, tipos de correlação. regressão linear pelo... 
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